Bitext segmentation and alignment for specialized document composition
Identifieur interne : 009448 ( Main/Exploration ); précédent : 009447; suivant : 009449Bitext segmentation and alignment for specialized document composition
Auteurs : Arantza Casillas [Espagne] ; Raquel Martinez [États-Unis]Source :
- TAL. Traitement automatique des langues [ 1248-9433 ] ; 2001.
Descripteurs français
- Pascal (Inist)
English descriptors
- KwdEn :
Abstract
Nous montrons comment, à partir de textes parallèles annotés, il est possible de dériver des ressources linguistiques complémentaires: d'une part des mémoires de traduction spécifiques et d'autre part des DTDs propres aux textes sources et aux textes cibles, qui sont ensuite mis en correspondance. Le présent article discute les méthodes utilisées pour générer ces ressources automatiquement et les appliquer à un environnement auteur bilingue.
Affiliations:
Links toward previous steps (curation, corpus...)
- to stream PascalFrancis, to step Corpus: 000909
- to stream PascalFrancis, to step Curation: 000A33
- to stream PascalFrancis, to step Checkpoint: 000916
- to stream Main, to step Merge: 009999
- to stream Main, to step Curation: 009448
Le document en format XML
<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" level="a">Bitext segmentation and alignment for specialized document composition</title>
<author><name sortKey="Casillas, Arantza" sort="Casillas, Arantza" uniqKey="Casillas A" first="Arantza" last="Casillas">Arantza Casillas</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Departamento de Electricidad y Electrónica, Facultad de Ciencias, UPV-EHU, Apdo. 644</s1>
<s2>48080 Bilbao</s2>
<s3>ESP</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>Espagne</country>
<placeName><region nuts="2" type="communauté">Pays basque</region>
</placeName>
</affiliation>
</author>
<author><name sortKey="Martinez, Raquel" sort="Martinez, Raquel" uniqKey="Martinez R" first="Raquel" last="Martinez">Raquel Martinez</name>
<affiliation wicri:level="3"><inist:fA14 i1="02"><s1>Departamento ESCET, Universidad Rey Juan Carlos, Tulipán s/n</s1>
<s2>28933 Móstoles, Madrid</s2>
<s3>USA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><settlement type="city">Madrid</settlement>
<region nuts="2" type="region">Communauté de Madrid</region>
</placeName>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">524-02-13645</idno>
<date when="2001">2001</date>
<idno type="stanalyst">FRANCIS 524-02-13645 INIST</idno>
<idno type="RBID">Francis:524-02-13645</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000909</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000A33</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000916</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000916</idno>
<idno type="wicri:doubleKey">1248-9433:2001:Casillas A:bitext:segmentation:and</idno>
<idno type="wicri:Area/Main/Merge">009999</idno>
<idno type="wicri:Area/Main/Curation">009448</idno>
<idno type="wicri:Area/Main/Exploration">009448</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en" level="a">Bitext segmentation and alignment for specialized document composition</title>
<author><name sortKey="Casillas, Arantza" sort="Casillas, Arantza" uniqKey="Casillas A" first="Arantza" last="Casillas">Arantza Casillas</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Departamento de Electricidad y Electrónica, Facultad de Ciencias, UPV-EHU, Apdo. 644</s1>
<s2>48080 Bilbao</s2>
<s3>ESP</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>Espagne</country>
<placeName><region nuts="2" type="communauté">Pays basque</region>
</placeName>
</affiliation>
</author>
<author><name sortKey="Martinez, Raquel" sort="Martinez, Raquel" uniqKey="Martinez R" first="Raquel" last="Martinez">Raquel Martinez</name>
<affiliation wicri:level="3"><inist:fA14 i1="02"><s1>Departamento ESCET, Universidad Rey Juan Carlos, Tulipán s/n</s1>
<s2>28933 Móstoles, Madrid</s2>
<s3>USA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><settlement type="city">Madrid</settlement>
<region nuts="2" type="region">Communauté de Madrid</region>
</placeName>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">TAL. Traitement automatique des langues</title>
<title level="j" type="abbreviated">TAL, Trait. autom. lang.</title>
<idno type="ISSN">1248-9433</idno>
<imprint><date when="2001">2001</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">TAL. Traitement automatique des langues</title>
<title level="j" type="abbreviated">TAL, Trait. autom. lang.</title>
<idno type="ISSN">1248-9433</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Alignment</term>
<term>Applied linguistics</term>
<term>Automatic generation</term>
<term>Computational linguistics</term>
<term>Corpus linguistics</term>
<term>Linguistic resources</term>
<term>Natural language processing</term>
<term>Parallel corpus</term>
<term>Segmentation</term>
<term>Translation memories</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Linguistique appliquée</term>
<term>Linguistique informatique</term>
<term>Linguistique de corpus</term>
<term>Corpus parallèle</term>
<term>Génération automatique</term>
<term>Segmentation</term>
<term>Alignement</term>
<term>Traitement automatique des langues naturelles</term>
<term>Ressources linguistiques</term>
<term>Mémoires de traduction</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Nous montrons comment, à partir de textes parallèles annotés, il est possible de dériver des ressources linguistiques complémentaires: d'une part des mémoires de traduction spécifiques et d'autre part des DTDs propres aux textes sources et aux textes cibles, qui sont ensuite mis en correspondance. Le présent article discute les méthodes utilisées pour générer ces ressources automatiquement et les appliquer à un environnement auteur bilingue.</div>
</front>
</TEI>
<affiliations><list><country><li>Espagne</li>
<li>États-Unis</li>
</country>
<region><li>Communauté de Madrid</li>
<li>Pays basque</li>
</region>
<settlement><li>Madrid</li>
</settlement>
</list>
<tree><country name="Espagne"><region name="Pays basque"><name sortKey="Casillas, Arantza" sort="Casillas, Arantza" uniqKey="Casillas A" first="Arantza" last="Casillas">Arantza Casillas</name>
</region>
</country>
<country name="États-Unis"><region name="Communauté de Madrid"><name sortKey="Martinez, Raquel" sort="Martinez, Raquel" uniqKey="Martinez R" first="Raquel" last="Martinez">Raquel Martinez</name>
</region>
</country>
</tree>
</affiliations>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 009448 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 009448 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Lorraine |area= InforLorV4 |flux= Main |étape= Exploration |type= RBID |clé= Francis:524-02-13645 |texte= Bitext segmentation and alignment for specialized document composition }}
This area was generated with Dilib version V0.6.33. |